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摘要 精神 分 裂 症 是 一 种 常见 的 精神 疾病 ， 表 现 为 多 方面 的 症状 ， 其 中 ， 语 言 异常 是 精神 分 
裂 症 患者 认 知 损伤 的 核心 症状 之 一 。 本 文 关注 精神 分 裂 症 患者 的 语音 感知 ， 从 音 段 和 超 音 段 
两 方面 简 述 国内 外 对 精神 分 裂 证 患者 语音 感知 开展 的 行为 和 神经 科学 实验 , 指出 中 国 应 加 大 
对 中 国 精 神 分 裂 症 患 者 的 汉语 语音 感知 探索 。 
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精神 分 裂 症 是 一 种 复杂 、 异 质 性 行为 和 认 知 综合 症 , 对 患者 个 人 、 家 属 和 社会 都 有 深远 
影响 ， 一 般 认 为 精神 分 裂 症 的 症状 主要 有 阳性 症状 、 阴 性 症状 和 认 知 损伤 (Owen, Sawa, & 
Mortensen, 2016) 。 

作为 精神 分 裂 症 的 主要 症状 之 一 , 认 知 损伤 不 仅 包括 神经 心理 学 领域 的 注意 、 记 忆 、 加 
工 速度 和 推理 ， 还 包括 社会 认 知 中 的 高 级 领域 ， 如 归属 、 意 图 、 动 作 和 情感 等 指导 社会 行为 
的 心理 活动 (van, Kenis, & Rutten, 2010) 。 语 言 作 为 人 类 行为 的 基础 ， 是 认 知 功能 的 重要 组 
成 部 分 ， 许 多 精神 分 裂 证 患者 都 存在 语言 异常 症状 〈Covington et al., 2005) 。 对 患者 来 说 ， 
语言 上 的 障碍 不 仅 影响 社会 交往 ， 还 会 降低 生活 质量 (Bellani, Perlini, & Brambilla, 2009) 。 
因此 ， 研 究 患者 的 语言 异常 具有 重要 意义 。 

从 语言 学 的 角度 看 , 当前 国内 外 学 者 对 精神 分 裂 症 患者 语言 异常 的 研究 基本 可 以 分 为 语 
音 、 词 法 、 句 法、 语义 、 语 用 等 语言 层面 (Bellani et al., 2009; Covington et al., 2005) ， 其 中 
从 语音 入 手 了 解 患者 的 语言 异常 ， 是 较为 直接 的 方法 。 目 前 ， 国 内 外 学 者 对 精神 分 裂 症 不 仅 
关注 言语 感知 异常 表现 , 而 且 关 注 语音 感知 损伤 的 神经 机 制 , 试图 从 患者 大 脑 表现 出 的 异常 
揭示 患者 出 现 语音 感知 异常 的 原因 。 本文 对 精神 分 裂 症 患 者 的 语音 感知 研究 进行 综述 ， 并 对 
未 来 研究 趋势 作出 展望 。 
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2 精神 分 裂 症 患者 的 音 段 感知 


对 语音 的 描述 可 以 使 用 音 段 和 超 音 段 层 次 , 音 段 层次 指 元 音 和 辅音 。 超 音 段 层次 涉及 超 
过 单个 辅音 和 元 音 的 言语 方面 语音 特征 , 主要 包括 声调 、 重音 和 语调 , 其 语音 学 基础 是 音 高 、 
音 长 、 音 强 的 动态 模式 (Clark & Yallop, 1990; Ladefoged & Johnson, 2011) 。 本 文 分 别 从 音 
段 和 超 音 段 两 方面 对 精神 分 裂 症 的 语音 感知 表现 进行 述评 。 

Kugler 和 Caudrey (1983) 对 精神 分 裂 症 患者 和 健康 对 照 组 进行 音 位 感知 研究 ， 任 务 是 
让 被 试 判 断 听 到 的 音节 〈 如 /ba/-/ba/，/ba/-/da/) 是 否 相 同 ， 结 果 发 现 患 者 在 感知 上 存在 明显 
损伤 。 与 此 类 似 ，Cienfuegos, March, Shelley 和 Javitt (1999) 使 用 行为 实验 考察 精神 分 裂 症 
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患者 和 健康 对 照 组 感知 音 位 的 表现 ， 任 务 是 让 被 试 分 辨 自然 的 /ba/、/da/ 音 节 和 合成 的 从 /ba/ 
到 /da/ 的 系列 声音 刺激 ， 结 果 发 现 ， 患 者 组 和 对 照 组 都 可 以 辨认 出 自然 的 /ba/、/da/ 音 节 ， 但 
在 辨认 合成 的 音节 时 ， 患 者 表现 较 差 ,提示 患 者 音 位 范畴 性 感知 受 损 。 

Hugdahl 等 人 (2012) 进一步 通过 两 耳 分 上 听 测 验 揭示 出 约 听 与 音 位 感知 的 关系 ,实验 中 ， 
精神 分 裂 症 患者 左右 耳 同 时 被 输入 不 同 的 音节 ， 如 /ba/-/da/， 结 果 显示 ， 上 患者 幻 听 症状 的 严 
重 程度 与 右 耳 感知 正确 率 呈 显著 负 相 关 。 常 人 的 语音 感知 主要 在 左 脑 中 进行 ,表现 为 右 耳 优 
势 , 而 患者 的 右 耳 感知 正确 率 随 幻 听 症状 的 加 深 而 下 降 。 研究 者 认为 处 理 右 耳 语音 感知 的 脑 
区 与 幻 听 相同 , 即 幻 听 是 发 源 于 左 脑 的 言语 感知 异常 , 这 一 结果 为 幻 听 的 言语 感知 异常 模型 
提供 了 支持 。Tsao, Chiang 和 Liu (2013) 以 有 无 幻 听 症 状 的 精神 分 裂 症 患者 以 及 健康 对 照 
组 作 被 试 , 使 用 合成 的 塞 擦 音 和 摩擦 首 音节 作为 语音 刺激 ,发 现 患 者 对 塞 擦 音 的 感知 比 健康 
对 照 组 差 , 且 有 约 听 的 患者 比 无 约 听 的 患者 表现 更 差 。 这 表明 精神 分 裂 症 患 者 感知 语音 的 敏 
感性 减弱 ， 幻 听 可 导致 精神 分 裂 症 患者 辅音 感知 损伤 。 

为 进一步 了 解 患者 感知 音 位 异常 的 生理 基础 以 及 参与 这 一 过 程 的 大 脑 皮 层 ，Kasai 等 人 

(2002) 和 Kasai 等 人 (2003) 分 别 用 ERP 和 MEG 记录 精神 分 裂 症 患者 和 健康 对 照 组 感知 
音 位 的 表现 ， 两 个 研究 采用 的 三 组 刺激 相同 ,分别 用 来 引起 纯音 音 长 改变 、 日语 元 音 /a/ 音 长 
改变 和 元 音 音 位 改变 出 现 的 MMN 和 MMNm。 第 一 个 研究 发 现 ， 与 纯音 音 长 和 元 音 音 长 的 
改变 相 比 ， 音 位 改变 引发 的 患者 MMN 振幅 最 小 ， 此 外 ， 与 健康 对 照 组 相 比 ， 音 位 改变 引发 
的 患者 MMN 的 双 侧 振幅 较 小 。 作 者 认为 患者 的 额 颗 时 皮层 网 络 出 现 损伤 .第 二 个 研究 发 现 ， 
与 健康 人 相 比 ， 患 者 三 种 MMNm 的 磁场 力 都 较 小 ， 且 音 位 改变 引起 的 MMNm 差异 最 为 显 
著 ， 此 外 ， 患 者 三 种 MMNm 功率 没有 发 现 异 常 的 不 对 称 ， 这 一 研究 为 患者 两 侧 听觉 皮层 受 
损 提供 了 生理 学 证 据 。 此 外 ， 研 究 发 现 涉 及 MMNm 生成 的 里 平面 神经 元 集群 存在 损伤 。 
在 上 述 研究 中 , 研究 者 通过 行为 和 神经 科学 实验 对 精神 分 裂 症 患 者 感知 音 段 的 表现 进行 
了 探索 ， 发 现 精 神 分 裂 症 患 者 在 感知 音 段 的 各 个 层次 都 存在 损伤 ， 且 这 种 损伤 与 幻 听 有 关 ， 
另外 ， 患 者 听觉 皮层 受 损 可 能 造成 音 段 感知 损伤 。 不 过 ， 现 有 研究 尽管 提供 了 初步 结论 ， 一 
些 地 方 还 值得 进一步 商 椎 和 深究 。 已 有 研究 从 被 试 选 择 来 看 ， 多 数 实 验 被 试 人 数 较 少 ; 被 试 
年 龄 跨度 过 大 ， 不 能 有 效 控制 认 知 老 化 对 语音 感知 的 影响 ;精神 分 裂 症 确诊 标准 不 一 ， 一 些 
研究 使 用 DSM-IV (Diagnostic and Statistical Manual of Mental Disorders, forth version) ， 但 
也 有 研究 使 用 ICD-10 (International Classification of Diseases, tenth version) ; 精神 分 裂 症 患 
者 病 龄 跨度 过 大 , 难以 控制 疾病 发 展 对 患者 感知 能 力 的 影响 ; 实验 期 间 精 神 分 裂 症 患者 服药 
状况 不 一 , 难以 控制 药物 对 实验 结果 的 影响 ; 多 数 研究 选用 英语 母语 被 试 , 缺乏 对 其 他 语种 
的 考察 ;部 分 实验 没有 测量 被 试 的 听觉 能 力 , 难以 控制 听力 损伤 对 语音 识别 能 力 的 影响 ， 虽 
然 Kasai 等 人 (2002) 和 Kasai 等 人 (2003) 排除 了 听力 损伤 被 试 但 没有 具体 讲 排除 标准 。 
从 实验 刺激 来 看 , 已 有 研究 使 用 的 刺激 仅 局 限于 音 段 特征 中 某 一 小 类 ， 如 使 用 塞音 和 元 音 组 
成 的 音节 ， 塞 擦 音 和 摩擦 音 合成 的 辅音 ， 以 及 单个 元 音 等 ， 不 能 全 面 反映 患者 是 否 对 所 有 和 
类 的 音 位 都 存在 感知 异常 ， 如 患者 感知 更 加 细 分 的 元 音 分 类 《〈 如 前 、 后 、 高 、 低 元 音 ) 和 如 
BOR WAR. UE) 是 否 存在 损伤 依然 需要 考察 。 
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3 精神 分 裂 症 患者 的 超 音 段 感知 


超 音 段 特征 往往 与 语义 相 联 系 , 因而 具有 音 位 的 辨 义 功能 。 超 音 段 特征 表现 为 语 流 中 声 
音 的 抑扬顿挫 。 因 而 有 语音 学 家 也 把 它们 称 为 韵律 特征 〈 华 维 芬 ，1993) 。 韵 律 可 以 分 为 言 
语 和 情绪 韵律 (Hoekert, Kahn, Pijnenborg, & Aleman, 2007) 。 言 语 韵 律 指 对 语义 做 出 决策 ， 
例如 ,强调 句子 主要 部 分 ,通过 陈述 或 问题 呈现 信息 等 。 情 绪 韵 律 指 带 有 情绪 的 语调 ， 对 感 
知情 绪 状 态 和 说 话 人 意图 非常 重要 。 对 精神 分 裂 症 患 者 言语 韵律 感知 的 研究 ， 主 要 从 音 高 、 


音 长 和 音 强 这 三 个 声学 指标 展开 。 对 情绪 韵律 的 研究 , 研究 者 则 主要 关注 两 方面 , 一 是 研究 
各 种 情感 的 声学 变量 , 二 是 试图 把 理解 情绪 韵律 的 能 力 同 脑 区 联系 起 来 (Edwards, Jackson, & 
Pattison, 2002; Hoekert et al., 2007) 。 


3.1 精神 分 裂 症 患者 的 音 高 感知 

音 高 指 声音 的 高 低 ， 是 基 频 CFO) 的 感知 相关 物 〈Clark & Yallop, 1990) 。 对 精神 分 裂 
证 患者 音 高 感知 的 研究 分 为 两 类 , 一 是 通过 测量 音 高 感知 能 力 对 静态 音 高 进行 研究 , 二 是 对 
动态 音 高 的 研究 ， 即 对 音 高 变化 感知 能 力 进行 测量 ， 如 汉语 声调 就 是 音 高 变化 的 一 种 表现 。 
以 下 从 静态 音 高 和 动态 音 高 两 方面 对 精神 分 裂 症 患 者 的 音 高 感知 表现 研究 进行 述评 。 

Dondé A. (2017) 指出 音 高 匹配 任务 (Tone-Matching Task) 是 检测 患者 静态 音 高 感知 
能 力 的 主要 方法 ， 这 种 任务 简单 、 准 确 、 可 信 ， 实 验 中 ， 被 试 会 听 到 成 对 音 高 相同 或 不 同 的 
非 语 言 声音 ， 并 在 “相同 ”和 “不 同 ”* 两 个 按键 上 选择 ， 最 后 ， 研 究 人 员 通 过 计算 回答 正确 率 来 
评估 被 试 的 表现 。 他 们 对 研究 精神 分 裂 症 患 者 音 高 匹配 能 力 的 文章 进行 综述 和 元 分 析 ， 发 现 
与 健康 对 照 组 相 比 ， 患 者 在 音 高 匹配 任务 上 表现 明显 较 差 。 

由 于 认识 到 大 多 数 的 研究 都 集中 在 英语 母语 精神 分 裂 证 患者 上 ，Yang 等 人 (2012) 对 
母语 为 汉语 的 精神 分 裂 症 患 者 展开 研究 。 作 者 发 现 ， 与 英语 母语 精神 分 裂 症 患 者 一 样 ， 汉 语 
母语 精神 分 裂 症 患者 也 存在 音 高 匹配 损伤 ， 有 具体 来 看 ， 汉 语 母 语 患者 平均 需要 20% 的 音 高 
差异 才能 达到 对 照 组 2.5% 音 高 差异 相同 的 正确 率 。 

与 此 同时 ， 一 系列 研究 探索 这 种 损伤 产生 的 神经 机 制 。Javitt (2000) 发 现 ， 与 标准 音 
存在 20% 音 高 差异 的 偏差 听觉 刺激 引发 的 患者 MMN 振幅 与 $% 偏 差 听 觉 刺 激 在 健康 对 照 组 
中 引发 的 MMN 振幅 相似 , 说 明 患 者 辨别 音 高 能 力 差 与 偏差 听觉 刺激 诱发 的 MMN 振幅 减 小 
关 。 而 且 ， 一 些 EEG、MEG、fMRI 实验 证 明 ，MMN 产生 于 初级 听觉 皮层 ， 因 此 可 以 推 
断 患 者 的 初级 听觉 皮层 出 现 损伤 。 具 体 来 说 ， 可 能 是 听觉 皮层 中 NMDA (N-FAZER A ARR 
受 体 调节 的 神经 传递 出 现 异常 。Javitt, Spencer, Thaker, Winterer 和 Hajós (2008) 又 重申 这 一 
观点 ， 即 MMN 异常 可 以 反映 初级 听觉 皮层 损伤 。 

Javitt (2000) 和 Javitt 等 人 〈2008) 从 初级 听觉 皮层 功能 损伤 的 角度 解释 患者 辨别 音 高 
能 力 差 的 原因 ， 而 Sweet 等 人 《〈2007) 则 从 初级 听觉 皮层 结构 损伤 的 角度 做 出 解释 。Sweet 
等 人 (2007) 发 现 精神 分 裂 症 患 者 初级 听觉 皮层 的 前 馈 环 路 存在 结构 损伤 ， 即 患者 的 突 触 素 
免疫 反应 斑点 (Synaptophysin-immunoreactive puncta， 轴 突 终 末 的 标记 物 ) 密度 较 小 。 他 们 
分 析 ， 这 种 损伤 可 能 导致 患者 接受 听觉 刺激 后 初级 听觉 皮层 激活 传播 异常 ， 进 而 导致 患者 
MMN 和 音 高 匹配 能 力 异常 。 

Todd “A. (2008) 进一步 发 现 ， 音 高 改变 引发 的 MMN 振幅 减 小 只 在 病 龄 长 的 精神 分 
裂 症 患 者 上 显著 ， 而 在 首发 或 病 龄 短 的 患者 上 没有 明显 减 小 , 表明 音 高 改变 引发 的 MMN 可 
作为 患者 听觉 皮层 病变 程度 的 指标 。 

对 动态 音 高 的 研究 可 分 为 两 种 ， 第 一 种 是 对 英语 句子 中 音 高 变化 的 研究 。 如 Matsumoto 
等 人 (2006) 在 考察 了 精神 分 裂 症 患者 和 健康 对 照 组 在 辨别 句 中 音 高 、 句 末 音 高 和 句子 节奏 
三 种 任务 上 的 表现 后 发 现 , 与 健康 人 相 比 ,精神 分 裂 症 患 者 理解 句 末 音 高 变化 没有 异常 ， 如 
理解 疑问 句 末 的 音 高 变化 ， 但 理解 句 中 音 高 变化 明显 较 差 。 

第 二 种 是 对 汉语 声调 的 研究 。 声 调 是 音节 或 词 (组 ) 的 音 高 运动 模式 ,包括 音 高 升降 
折 的 形式 〈 即 调 形 ) 和 相对 的 音阶 特征 〈 曹 剑 芬 ，2002) ， 因 此 声调 本 质 上 是 复杂 的 音 高 动 
态 变 化 。 对 音 高 在 声调 语言 和 非 声调 语言 中 起 到 的 作用 ，Wang A (2018) 通过 回顾 文献 
发 现 , 在 汉语 这 样 的 声调 语言 中 ,构成 声调 的 主要 声学 特征 是 基 频 ， 可 以 用 来 区 分 相同 音节 
或 词 (组 ) 的 语义 ， 而 在 英语 这 样 的 非 声调 语言 中 ， 音 高 则 主要 用 于 传达 语 用 上 的 信息 ， 如 
表达 强调 ， 句 子 情态 或 者 情感 ， 因 此 对 声调 和 非 声调 语言 来 说 ， 音 高 曲线 在 感知 言语 时 都 能 


起 到 重要 作用 。 

Tsao 等 人 〈2013) 以 有 无 幻 听 症状 的 精神 分 裂 症 患者 和 建 康 对 照 组 为 被 试 ， 用 带 有 汉 
语 声调 的 元 音 /i/ 作 刺激 。 结 果 发 现 ， 患 者 感知 汉语 四 个 声调 的 正确 率 显 著 低 于 健康 对 照 组 ， 
且 有 幻 听 症状 的 患者 表现 更 差 。Yang 等 人 2012) 通过 对 比 精 神 分 裂 症 患 者 和 健康 对 照 组 
在 音 高 匹配 测试 (Tone matching test) ~ HAARMA (Distorted Chinese tunes) 、 词 语 辩 
别 CWord discrimination) 和 词语 识别 (Word identification) 任务 上 的 表现 ， 发现 与 健康 对 照 
组 相 比 ， 精 神 分 裂 症 患者 在 每 项 测试 中 都 明显 表现 较 差 ,作者 认为 ,精神 分 裂 症 患者 在 声调 
和 上 听觉 词汇 加 工 上 存在 严重 损伤 ， 且 这 两 者 显著 相关 。Wang 等 人 (2018) 设计 四 种 句子 作 
刺激 ， 分 别 是 声调 、 句 法 和 语义 完全 正确 的 句子 ， 声 调 不 正确 (声学 特征 表现 为 扁平 的 F0 
曲线 ) 、 句 法 和 语义 正确 的 句子 ， 声 调 正确 、 句 法 和 语义 不 正确 的 句子 ， 声 调 、 句 法 和 语义 
都 不 正确 的 句子 , 实验 中 让 被 试 写 下 听 到 的 句子 , 然后 通过 计算 正确 关键 词 的 数量 来 判断 被 
试 对 句子 理解 的 正确 程度 , 发 现 与 健康 对 照 组 相 比 , 精神 分 裂 症 患 者 理解 全 部 四 种 句子 的 表 
现 明 显 较 差 ， 且 患者 的 幻觉 越 严 重 ， 对 句子 的 理解 越 差 。 作 者 推测 ， 约 听 引 起 的 内 部 噪音 五 
能 导致 患者 言语 感知 和 理解 变 差 。 
以 上 三 个 研究 通过 行为 实验 证 明 患 者 存在 声调 感知 损伤 。Wang 等 人 2017) 的 研究 则 
从 神经 科学 的 角度 分 析 患 者 声调 感知 受 损 的 现象 ， 他 们 使 用 听觉 oddball 范式 (标准 刺激 和 
偏差 刺激 分 别 是 1000HZ 和 2000HZ 的 纯音 ) 对 中 国 精神 分 裂 症 患 者 进行 研究 发 现 ， 与 健康 
对 照 组 相 比 ， 中 国 精 神 分 裂 症 患 者 的 P300 效应 较 小 ， 证 明 中 国 精神 分 裂 症 患者 在 辨别 不 同 
音 高 的 纯音 上 存在 损伤 ， 由 于 P300 效应 可 以 反映 在 不 同 频 率 下 识别 不 同 纯音 的 能 力 ， 所 以 
这 种 能 力 可 能 是 声调 意识 产生 的 基础 。 

总 体 来 看 ,研究 者 通过 行为 和 神经 科学 实验 对 精神 分 裂 症 患者 感知 超 音 段 特征 音 高 的 表 
现 进行 了 一 些 研究 , 覆盖 静态 和 动态 音 高 两 方面 内 容 , 患者 在 感知 以 上 两 方面 音 高 形式 时 均 
出 现 差 于 正常 人 的 表现 ， 神 经 科学 实验 发 现 MMN 和 P300 这 两 个 指标 能 反应 患者 音 高 感知 
损伤 ,而 且 这 种 损伤 可 能 是 初级 听觉 皮层 的 结构 和 功能 损伤 导致 。 此 外 ， 患 者 基本 音 高 感知 
能 力 损伤 可 能 导致 听觉 词汇 感知 错误 (Yang et al., 2012) 、 句 子 感知 错误 (Matsumoto et al,. 
2006; Wang et al., 2018) 和 高 级 认 知 能 力 如 情绪 感知 损伤 (Dondk et al., 2017) ， 进 而 影响 语 
言 交 流 ， 如 患者 的 音 高 感知 损伤 与 听觉 词汇 识别 和 听觉 词汇 辨别 表现 差 相 关 〈Yang et al., 
2012) ， 患 者 在 理解 句子 重点 上 存在 困难 (Matsumoto et al,. 2006) ， 患 者 不 能 利用 句子 语 
境 来 弥补 声调 异常 对 句 意 的 影响 (Wang et al., 2018) 。 但 已 有 研究 还 存在 一 些 不 足 ， 例 如 ， 
在 被 试 选择 上 依然 存在 音 段 研究 中 提 到 的 问题 ,只 有 Todd A (2008) 对 病 龄 进行 控制 ， 
进而 发 现 音 高 改变 引发 的 MMN 可 作为 患者 听觉 皮层 病变 程度 的 指标 。Todd 等 人 《2008 ) 
还 使 用 听力 测验 评估 (audiometric assessment) 排除 了 听力 损伤 被 试 ， 有 效 控制 了 听力 损伤 
对 语音 识别 的 影响 。 从 实验 刺激 上 看 ， 汉 语 声调 的 感知 已 经 引起 部 分 研究 者 重视 ,但 是 与 对 
非 声调 语言 的 研究 相 比 ， 对 汉语 声调 的 研究 还 处 于 起 步 阶段 ， 需 要 引起 广大 中 国学 者 重视 。 
从 实验 设计 上 看 ，Wang 等 人 (2017) 在 同一 群 被 试 上 开展 行为 和 神经 科学 实验 ， 并 将 两 项 
实验 结果 结合 分 析 得 出 精神 分 裂 症 患者 语音 加 工 受 损 的 神经 基础 P300， 他 们 的 研究 不 仅 发 
现 患 者 的 语音 加 工 损 伤 , 而 且 揭 示 患 者 出 现 损伤 的 神经 基础 ,充分 利用 了 两 种 实验 结合 的 优 
势 。 


3.2 精神 分 裂 症 患者 的 音 长 和 音 强 感知 

音 长 指 声音 自始至终 所 需 的 时 间 长 短 。 作 为 声音 的 一 种 属性 ,， 音 长 不 能 与 言语 产 出 中 大 
的 背景 一 一 时 间 分 开 (Clark & Yallop, 1990) ， 因 此 ， 对 于 精神 分 裂 症 患 者 音 长 感知 的 研究 
通常 和 时 间 加 工 联系 起 来 。Thoenes 和 Oberfeld (2017) 采用 元 分 析 方 法 分 析 精 神 分 裂 症 患 
者 的 视觉 和 听觉 时 间 感 知 能 力 ， 结 果 显示 ， 患 者 感知 时 间 的 准确 性 较 低 。 按 实验 刺激 不 同 ， 
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对 音 长 感知 的 研究 可 分 为 两 类 ， 一 类 是 声音 刺激 出 现 的 间隔 时 长 不 同 ， 如 Davalos, Kisley 和 
Ross (2003) 发 现 ， 精 神 分 裂 症 患 者 在 区 分 非 语言 音 的 刺激 间隔 时 长 上 存在 困难 ， 表 明 患 者 
存在 听觉 上 的 时 间 感 知 异 常 。 神 经 科学 实验 如 Shelley 等 人 (1991) 发 现 ， 与 健康 对 照 组 相 
比 , 精神 分 裂 症 患者 由 刺激 间隔 变 长 和 变 短 引 起 的 MMN 都 较 小 , 但 由 刺激 间隔 变 长 引起 的 
MMN 减 小 更 为 显著 。Erwin, Mawhinney-Hee, Gur 和 Gur (1991) 发 现 间隔 时 长 不 同 的 刺激 
引起 患者 的 Pl 和 NI 的 振幅 变化 范围 较 小 ， 由 于 Pl 产生 于 丘脑 ,因此 这 一 结果 与 患者 存在 
丘脑 异常 的 报告 一 致 。 

另 一 类 是 声音 刺激 的 长 度 不 同 ， 如 Davalos, Rojas 和 Tregellas (2011) 发 现 ， 与 健康 对 
照 组 相 比 ， 精 神 分 裂 症 患者 识别 非 语言 声音 的 长 度 表 现 较 差 ， 而 且 ，fMRI 记录 显示 ， 与 健 
康 对 照 组 相 比 ， 精 神 分 裂 证 患者 在 识别 非 语言 音 的 长 度 时 ， 脑 纹 状 体 和 岛 叶 激活 较 弱 ， 提 示 
患者 这 些 区 域 可 能 存在 损伤 。Atkinson, Michie 和 Schall (2012) 发 现 ， 与 健康 对 照 组 相 比 ， 
病 龄 短 的 精神 分 裂 症 患 者 感知 音 长 改变 诱发 的 MMN 明显 减少 , 有 旦 患者 在 发 病 前 就 存在 这 种 
状况 。Shin 等 人 (2009) (基于 MEG) 和 Atkinson A, (2012) (ŒF EEG) 探究 音 长 改 
变 诱发 的 MMN 是 否 可 以 作为 精神 分 裂 症 的 预测 指标 , 都 发 现 与 健康 对 照 组 相 比 , 精神 分 裂 
症 超 高 危 人 群 感知 音 长 偏差 刺激 时 出 现 的 MMN 振幅 或 MMNm 偶 极 矩 明显 较 小 。 而 且 ， 
MMN 振幅 减 小 与 左 侧 显 横 回 灰 质 体积 减少 明显 相关 (Salisbury, Kuroki, Kasai, Shenton, & 
McCarley, 2007) ， 提 示 患 者 部 分 脑 区 灰质 体积 减少 也 可 能 导致 语音 感知 损伤 。Atkinson 等 
人 (2012) WA, 音 长 偏差 刺激 诱发 的 MMN 可 以 作为 精神 分 裂 症 前 驱 症 状 的 标志 , BE MMN 
可 用 来 测量 精神 分 裂 症 超 高 危 人 群 最 终 成 为 精神 分 裂 症 患 者 的 可 能 性 。 除 了 MMN，P3a 也 
是 预测 精神 分 裂 症 超 高 危 人 群发 病 的 一 个 指标 ，Atkinson 等 人 (2012) 发 现 精 神 分 裂 症 超 高 
fe AFERI P3a 振幅 虽然 有 所 减 小 , 但 并 不 显著 ,而 首发 精神 病 患 者 的 P3a 振幅 明显 较 小 ,此 
外 ，MMN 和 P3a 的 趋势 并 不 相关 ， 提 示 这 两 个 指标 反映 不 同 的 损伤 。 

音 强 通常 表示 为 语音 信号 中 声 压 变化 的 大 小 (Clark, & Yallop, 1990) . Todd 等 人 (2008) 
考察 健康 对 照 组 、 平均 病 龄 2.6 年 和 18.9 年 的 精神 分 裂 症 患者 在 感知 非 语言 音 的 音 高 、 音 长 
和 音 强 的 表现 后 发 现 , 与 健康 对 照 组 相 比 , 病 龄 长 和 病 龄 短 的 患者 感知 音 强 的 辨别 阔 都 较 大 ， 
即 患者 组 比 对 照 组 需要 更 大 的 音 强 差异 来 区 分 声音 , 不 过 只 有 病 龄 短 的 患者 与 健康 对 照 组 的 
这 种 差异 是 显著 的 ， 此 外 ,他 们 在 考察 被 试 感知 音 强 改 变 诱发 的 MMN 后 发 现 , 与 健康 对 照 
组 相 比 , 病 龄 短 的 患者 产生 的 MMN 振幅 明显 较 小 , 而 病 龄 长 的 患者 产生 的 MMN 与 健康 人 
没有 差异 , 作者 分 析 ， 由 于 音 强 改变 在 健康 对 照 组 中 引发 的 MMN 振幅 会 随 着 被 试 年 龄 增 大 
而 减 小 ， 所 以 音 强 改 变 诱发 的 MMN 可 能 在 病 龄 长 的 患者 身上 出 现 敏感 性 降低 的 情况 。 

此 外 ，Gudlowski 等 人 (2009) , Park, Lee, Kim 和 Bae (2010) 发 现 ， 音 强 不 同 的 声音 
引起 精神 分 裂 症 患者 听觉 音 强 诱发 电位 LDAEP (loudness-dependence of auditory evoked 
potential〉 变 化 范围 较 小 ，LDAEP 表示 包括 响 度 在 内 的 声音 刺激 强度 变化 引起 的 Nl 和 了 2 
的 振幅 变化 ， 对 正常 人 来 说 ，LDAEP 的 振幅 随 着 声音 强度 或 响 度 的 增加 而 增加 。Teichert 
(2017) 认为 迟钝 的 LDAEP 是 精神 分 裂 症 患者 听觉 功能 改变 的 标志 ， 且 被 认为 是 血清 素 功 
能 改变 导致 ， 血 清 素 是 体内 产生 的 一 种 神经 传递 物质 。 

除了 听觉 方面 的 语音 加 工 受 损 , 大 量 研究 也 从 阅读 障碍 的 产生 机 制 考察 精神 分 裂 症 患 者 
的 语音 加 工 , 发 现 精神 分 裂 症 患者 的 阅读 困难 与 语音 加 工 能 力 受 损 有 关 (Whitford, O'Driscoll, 
& Titone, 2018) 。 如 Revheim $A (2014) 发 现 ， 精 神 分 裂 症 患 者 的 阅读 能 力 差 与 视觉 和 
听觉 感知 能 力 差 高 度 相关 ， 测 量 听 觉 感知 能 力 的 方法 包括 测量 音 高 、 音 长 和 音 强 诱发 的 
MMN， 不 过 ， 精 神 分 裂 症 临床 高 危 人 群 只 有 视觉 感知 能 力 差 ， 阅 读 中 的 语音 加 工 受 损 是 否 
在 发 病 前 就 已 存在 仍 有 待 确定 。Carri6n 等 人 (2015) 考察 精神 病 临 床 高 危 人 群 的 情况 ， 他 
们 发 现 ， 与 健康 人 相 比 ， 精 神 病 临床 高 危 人 群 由 非 语言 音 的 音 高 、 音 长 、 音 强 诱 发 的 MMN 
振幅 明显 较 小 ， 且 MMN 振幅 较 小 与 精神 病 临 床 高 危 人 群 的 阅读 能 力 差 、 加 工 速度 慢 、 社 会 


功能 和 角色 功能 差 相关 ， 提 示 患 者 初级 听觉 加 工 能 力 的 损伤 可 能 导致 高 级 的 社会 能 力 损伤 。 
上 述 研究 表明 ,精神 分 裂 症 患者 感知 音 长 和 音 强 都 存在 损伤 ， 而 且 ， 神经 科学 实验 还 发 
现 , 患者 感知 音 长 和 音 强 的 损伤 可 能 与 患者 大 脑 的 部 位 和 成 分 损伤 有 关 , 如 丘脑 、 脑 纹 状 体 、 
岛 叶 、 左 侧 颗 横 回 等 部 位 和 血清 素 这 一 神经 传递 物质 ， 同 时 ， 通 过 考察 患者 阅读 障碍 与 语音 
加 工 的 关系 , 患者 初级 听觉 加 工 能 力 的 损伤 可 能 导致 高 级 的 社会 能 力 如 阅读 能 力 的 损伤 。 男 
外 , 音 长 偏差 刺激 诱发 的 MMN 和 P3a 可 以 用 来 测量 精神 分 裂 症 超 高 危 人 群 最 终 成 为 精神 分 
裂 症 患者 的 可 能 性 ， 为 临床 确诊 疾病 提供 了 有 益 参考 。 不 过 也 要 看 到 ， 这 些 研究 还 存在 一 些 
问题 ， 从 被 试 选择 上 看 ， 依 然 存在 前 述 提 及 的 问题 ,但 是 已 有 研究 〈 如 Atkinson et al., 2012) 
将 被 试 范围 扩大 到 精神 分 裂 症 超 高 危 人 群 , 探索 疾病 确诊 前 的 症状 表现 ,这 对 辅助 诊断 十 分 
有 用 。 从 实验 刺激 上 看 , 已 有 研究 都 是 通过 非 语 言 音 的 刺激 对 患者 音 长 和 音 强 感 知 进行 考察 ， 
对 生活 中 常见 的 语言 音 中 的 音 长 和 音 强 还 缺乏 专门 探索 , 特别 是 汉语 作为 声调 语言 , 时 长 对 
声调 识别 有 十 分 重要 的 作用 (如 Liu & Samuel, 2004) ， 对 言语 感知 和 理解 有 直接 影响 。 


3.3 精神 分 裂 症 患者 的 情绪 韵律 感知 

对 情绪 的 感知 是 社会 认 知 的 一 个 方面 , 一 旦 情绪 感知 受 损 , 就 可 能 产生 误会 和 不 恰当 的 
社会 反应 (Hoekert et al., 2007) ， 所 以 正确 感知 情绪 对 了 解说 话 人 的 情绪 和 意图 非常 重要 ， 
对 情绪 的 感知 有 两 种 途径 ， 一 是 通过 观察 面部 表情 ， 二 是 通过 言语 表达 情绪 的 韵律 信息 ， 即 
本 节 关 注 的 情绪 韵律 。 

目前 ， 对 精神 分 裂 症 患者 情绪 韵律 感知 的 研究 大 多 围绕 英语 母语 精神 分 裂 症 患 者 展开 ， 
Chan, Wong, Wang 和 Lee (2008) 则 研究 中 国 精 神 分 裂 症 患者 感知 情绪 韵律 的 表现 ， 并 调查 
情绪 识别 能 力 的 神经 心理 学 预测 因子 。 在 考察 了 缓解 期 的 妄想 型 和 非 亡 想 型 精神 分 裂 症 患 者 
以 及 健康 人 在 情绪 韵律 识别 任务 、 测量 注意 力 和 视觉 感知 的 神经 心理 学 测试 中 的 表现 后 , 他 
们 发 现 , 缓解 期 的 非 亡 想 型 患者 存在 情绪 韵律 感知 损伤 ,而 缓解 期 的 妄想 型 患者 与 健康 对 照 
组 表现 一 样 ， 这 表明 绥 解 期 精神 分 裂 症 患者 仍然 存在 情感 识别 损伤 。 另 外 ,神经 心理 学 测试 
发 现 , 妄想 型 精神 分 裂 症 患者 在 控制 干扰 能 力 上 存在 损伤 , 而 非 亡 想 型 精神 分 裂 症 患 者 在 注 
意 机 制 上 存在 损伤 。 
在 对 患者 情绪 韵律 感知 的 研究 中 ，ERP 和 MRI 结果 都 证 明 ， 患 者 听觉 皮层 出 现 损伤 。 


Pinheiro $A (2014) 通过 记录 精神 分 裂 症 患者 和 健康 对 照 组 的 事件 相关 电位 ， 来 探究 1) 
r= 情绪 韵律 加 工 的 时 间 历 程 ，2〉 韵 律 和 语义 线索 对 情绪 韵律 加 工 的 影响 。 实 验 中 的 刺激 是 有 
O BERJA, DIEMER RIEAN (SCC) 和 有 韵律 无 语义 (PPC) 两 种 情况 下 。 结 果 


发 现 ， 与 健康 对 照 组 相 比 ， 患 者 组 加 工 高 兴 PPC 词汇 时 ， P50 减少 ， 加 工 无 情绪 SCC 词汇 、 
无 情绪 PPC 词汇 、 有 情绪 SCC 词汇 时 ，N100 减少 ， 加 工 高 兴 SCC 词汇 时 ，P200 增加 ， 行 
为 实验 结果 显示 ， 患 者 加 工 生 气 SCC 词汇 和 高 兴 PPC 词汇 时 ， 错 误 率 更 高 。 由 于 P50 是 初 
级 听觉 皮层 上 考察 感觉 记忆 形成 的 指标 ，N100 与 早期 听觉 编码 有 关 ， 主 要 产生 于 颗 上 回 ， 
P200 主要 产生 于 显 叶 皮层 ， 如 显 平 面 ， 所 以 这 些 指 标 异常 都 反应 出 患者 听觉 皮层 出 现 损 伤 。 
芷 者 认为 ， 感 觉 加 工 和 高 层次 的 加 工 异 常 共同 作用 于 精神 分 裂 症 患 者 的 情绪 韵律 加 工 异 常 ， 
旦 情绪 韵律 加 工 异 常 取决 于 刺激 的 复杂 性 。 

Leitman 等 人 (2007) 则 利用 弥散 张 量 成 像 (DTI) 分 析 精 神 分 裂 症 患者 韵律 加 工 异 常 
的 神经 机 制 , 在 考察 了 患者 组 与 健康 对 照 组 在 情绪 和 非 情绪 韵律 感知 任务 中 的 表现 后 , 发 现 
患者 在 感知 语言 中 的 情绪 和 语义 上 都 存在 损伤 ， 如 在 区 分 陈述 句 和 疑问 句 、 高兴 和 莫 伤 的 言 
语 时 ， 患 者 表现 较 差 。DTI 结果 显示 ， 患 者 初级 听觉 皮层 的 结构 和 功能 都 存在 损伤 ， 具 体 来 
说 ， 患 者 初级 听觉 能 力 辐射 的 脑 区 (从 丘脑 的 内 侧 膝 状 体 到 显 横 回 和 背 侧 、 腹 侧 听觉 通路 ) 
的 各 向 异性 分 数 较 小 , 而 较 小 的 各 加 异性 分 数 被 认为 是 反映 了 轴 突 或 髓 靖 (对 轴 突 内 的 信号 
传输 至 关 重 要 ) 的 损伤 (Kubicki etal., 2007; Owen et al., 2016) 。 钥 鞘 损 伤 引 起 的 语音 感知 
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问题 , 很 多 研究 已 有 所 证 实 , 例如 中 枢 神 经 系统 髓 精 异 常会 导致 听觉 处 理 障碍 ,听觉 神经 元 
轴 突 不 同 的 髓 精 化 模式 会 影响 高 低频 声音 信号 的 传导 速度 , 进而 影响 定位 声音 的 能 力 , 而 声 
音 定位 能 力 对 在 噪音 等 复杂 场景 中 感知 语音 至 关 重 要 , 此外, 中枢 神经 系统 髓 畏 异 常 也 可 能 
是 自 闭 症 谱系 障碍 患者 对 声音 过 度 敏感 、 听 觉 感知 失真 的 重要 原因 之 一 (Ford et al., 2015; 
Long, Wan, Robert, & Corfas, 2018) 。 

Mitchell, Elliott, Barry, Cruttenden 和 Woodruff (2004) 利用 fMRI 监测 被 试 在 被 动 聆听 
和 主动 感知 情绪 韵律 上 的 表现 , 发 现 精神 分 裂 症 患 者 在 被 动感 知 纯情 感 韵 律 时 显示 出 正常 的 
右 脑 偏 侧 化 ,但 在 感知 未 过 滤 的 情绪 韵律 时 显示 出 左 脑 偏 侧 化 , 当 患 者 主动 感知 情绪 韵律 时 ， 
左 岛 叶 的 激活 更 多 , 提示 患者 在 情绪 韵律 感知 上 可 能 是 左 脑 偏 侧 化 , 与 正常 的 右 脑 偏 侧 化 
同 ， 作 者 分 析 这 可 能 是 由 于 患者 岛 叶 体积 减 小 引起 的 。 另 外 ， 结 果 显 示 患 者 的 蜂 上 回 和 杜 中 
回 存在 功能 损伤 。 

Wylie 和 Tregellas (2010) 对 研究 精神 分 裂 症 患者 情绪 韵律 的 文章 进行 总 结 ,结果 发 现 ， 
从 损伤 发 生 的 时 间 看 ,情绪 韵律 损伤 在 首发 精神 分 裂 症 患 者 身上 已 经 出 现 ; 从 损伤 发 生 的 范 
弹 看 ， 精 神 分 裂 症 患 者 在 感知 和 表达 情绪 韵律 上 都 存在 损伤 。 有 具体 来 看 ,在 情绪 韵律 感知 任 
务 中 表现 差 的 精神 分 裂 症 患 者 比 正 常人 反应 时 间 长 三 倍 CHoekert et al., 2007) ; 从 损伤 发 生 
的 层面 看 ， 患 者 感知 句子 、 单 词 、 音 节 和 非 音节 声音 中 的 情绪 韵律 都 存在 损伤 ， 从 损伤 发 生 
的 严重 程度 看 ， 在 辨别 愤怒 、 害 怕 、 莫 伤 等 负面 情绪 时 ， 患 者 的 韵律 损伤 更 加 显著 ;从 情绪 
韵律 损伤 与 患者 其 他 缺陷 的 关系 看 ， 患 者 的 情绪 韵律 辨别 能 力 与 阴性 症状 的 严重 程度 相关 ， 
与 语义 加 工 能 力 相 关 ， 与 基本 音 高 感知 能 力 相 关 。Leitman A. (2008) 发 现 精 神 分 裂 症 患 
者 感知 情绪 韵律 的 能 力 受 损 与 基本 音 高 感知 能 力 受 损 有 关 , 其 结果 显示 , 患者 利用 基于 音 高 
的 声学 信号 的 能 力 明 显 较 差 , 所 以 患者 不 能 加 工 韵律 中 关键 的 声学 特征 可 能 导致 患者 情绪 韵 
律 感知 损伤 。 Kantrowitz 等 人 (2013) 进一步 研究 情绪 韵律 感知 与 基本 音 高 感知 之 间 的 关系 。 
在 实验 中 ， 精 神 分 裂 症 患者 组 和 健康 对 照 组 听 到 38 个 合成 的 调频 音 frequency modulated 
tones) ， 这 些 音 模拟 人 关口 语 的 主要 声学 特征 ， 被 试 被 要 求 辨 认 出 这 些 音 中 的 5 种 情绪 ， 
研究 人 员 分 别 分 析 基 频 的 平均 值 和 变化 性 、 高 频 能 量 的 有 无 对 识别 情绪 的 作用 。 此 外 ,被 试 
还 完成 了 音 高 匹配 实验 和 声音 情绪 识别 任务 。 他 们 发 现 ,调频 音 的 识别 模式 与 基本 的 音 高 识 
别 能 力 、 声 音 情绪 识别 能 力 、 阴 性 症状 相关 。 

总 的 来 说 , 对 精神 分 裂 症 患 者 情绪 韵律 感知 的 研究 比较 丰富 , 不 仅 对 患者 情绪 韵律 感知 
损伤 的 各 方面 情况 了 解 比较 深入 , 还 发 现 情绪 韵律 感知 与 基本 音 高 感知 间 的 关系 , 证 明 初 级 
的 听觉 认 知 能 力 会 影响 高 级 的 情绪 认 知 。 此 外 ， 神 经 科学 研究 通过 考察 P50，N100 和 P200 
这 三 个 指标 , 也 发 现 患 者 感知 情绪 韵律 时 听觉 皮层 出 现 异 常 , 佐证 了 音 段 和 言语 韵律 研究 中 
发 现 患 者 听觉 皮层 异常 的 结论 。 实 际 上 ,除了 表达 语义 和 情绪 ,声音 还 可 以 提供 很 多 隐 含 的 
言 息 ， 如 说 话 者 的 身份 线索 。Chhabra, Badcock, Maybery 和 Leung (2012) 发 现 ， 精 神 分 裂 
证 患者 可 以 和 正常 人 一 样 依 靠 平 均 基 频 区 别 声音 , 说 明 患 者 使 用 基于 音 高 的 线索 识别 说 话 人 
身份 的 能 力 没 有 受 损 ,但 是 ,不 论 是 有 约 听 还 是 无 幻 听 症 状 的 精神 分 裂 症 患 ， 都 很 少 使 用 共 
振 峰 分 布 (formant dispersion) 来 识别 声音 ， 而 健康 对 照 组 会 使 用 共振 峰 分 布 来 感知 说 话 人 
的 支配 倾向 、 性 别 、 体 重 、 年 龄 ， 这 表明 精神 分 裂 症 患 者 在 处 理 声音 中 的 身份 信息 时 存在 异 
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4 总 结 与 展望 


综 上 所 述 , 就 语音 感知 而 言 ， 当 前 研究 对 精神 分 裂 症 患者 在 音 段 和 超 音 段 各 个 层次 和 方 
用 的 感知 表现 都 进行 了 考察 。 行 为 实验 发 现 ， 与 健康 人 相 比 ， 患 者 在 感知 音 段 层次 中 辅音 、 
元 音 和 超 音 段 层次 中 言语 和 情绪 韵律 上 都 存在 损伤 , 神经 科学 实验 则 进一步 解释 患者 出 现 语 


音 感知 损伤 的 原因 可 能 是 大 脑 部 分 脑 区 和 成 分 出 现 损伤 ， 具 体 来 看 ， 大 量 研究 通过 考察 
MMN、P50、N100 和 P200 等 指标 发 现 患者 听觉 皮层 出 现 损 伤 , 同时 ,也 有 研究 (如 Davalos 
et al,, 2011; Erwin et al., 1991; Teichert, 2017) 发 现 患 者 大 脑 的 其 他 部 位 或 成 分 存在 损伤 ， 如 
脑 纹 状 体 、 岛 叶 、 丘 脑 等 部 位 和 血清 素 这 一 神经 传递 物质 。 当 把 发 现 的 这 些 脑 区 异常 放 到 听 
觉 系 统 中 ,就 可 以 看 出 这 些 部 位 的 异常 如 何 影 响 患 者 感知 语音 。 人 之 所 以 能 感知 语音 ,是 由 
听觉 系统 各 个 部 位 协作 完成 的 。 哺 乳 动物 听觉 系统 的 神经 部 分 大 致 包括 耳蜗 内 外 毛细 胞 、 螺 
旋 神 经 节 和 前 庭 耳 蜗 神 经 的 耳蜗 分 支 《 听 神经 ) 、 耳 蜗 核 复合 体 、 斜 方 体 、 上 橄榄 复合 体 、 
外 侧 丘 系 、 下 丘 、 下 丘 臂 、 内 侧 膝 状 体 、 匡 脑 皮 层 听 辐射 和 大 脑 听 觉 皮 层 〈Webster Popper, 
& Fay, 1992) 。 根据 现 有 对 精神 分 裂 症 患 者 的 研究 ， 相 关 部 位 的 损伤 都 会 导致 听觉 异常 。 在 
哺乳 动物 中 ， 所 有 已 知 的 听觉 信息 都 是 通过 听 神 经 进入 大 脑 (Webster et al., 1992) ， 患 者 
清 素 的 异常 证 明 这 一 传输 出 现 问 题 , 丘脑 和 听觉 皮层 出 现 异常 也 反映 出 听觉 系统 中 较 高 水 平 
的 听觉 加 工 出 现 损伤 ， 此 外 ， 也 有 研究 CU Davalos et al,, 2011) 发 现 患 者 的 脑 纹 状 体 和 岛 
叶 存 在 损伤 ， 这 其 实 与 这 些 部 位 在 大 脑 中 的 位 置 和 功能 密 不 可 分 ， 如 脑 纹 状 体 与 丘脑 相连 ， 
接受 丘脑 传 来 的 听觉 信息 ， 岛 叶 则 与 听觉 皮层 连接 ， 与 语言 功能 密切 相关 (Price, 2000; 
Webster et al., 1992) 。 
总 体 看 来 ， 当 前 研究 对 精神 分 裂 证 患者 的 语音 感知 研究 取得 了 一 定 成 果 ， 然 而 ， 除 了 上 
文中 提 及 的 感知 各 层次 上 的 探索 局 限 之 处 ， 还 有 以 下 几 方 面值 得 未 来 研究 注意 。 
第 一 ， 虽 然 现 有 研究 发 现 了 不 少 可 以 解释 患者 语音 感知 异常 的 脑 区 损伤 , 但 这 种 了 解 还 
不 够 深入 ,各 脑 区 之 间 的 作用 关系 也 还 不 清楚 ， 需 要 进一步 拓展 和 深入 ， 而 且 ， 语 音 感知 是 
人 类 基本 的 认 知 功能 , 初级 的 语音 感知 异常 如 音 高 感知 能 力 损伤 可 能 导致 词汇 、 句子 感知 出 
着 和 高 级 认 知 能 力 如 情绪 感知 困难 、 阅 读 能 力 下 降 ， 进 而 影响 语言 交流 。 所 以 患者 语音 感知 
能 力 与 其 他 认 知 功能 的 关系 仍 需要 更 多 关注 , 研究 者 应 重视 运用 先进 的 神经 科学 手段 对 以 上 
两 点 进行 深入 探究 。 可 以 看 到 随 着 科技 的 发 展 和 研究 条 件 的 改善 , 应 用 到 精神 分 裂 症 患者 语 
音 探索 中 的 技术 将 更 为 多 样 化 。 除 了 常用 的 ERP，EEG 和 MRI 等 研究 手段 外 ，MEG〈 脑 磁 
图 ) 和 fNIRS “〈 功 能 性 近 红 外 光谱 技术 ) 等 技术 在 语音 研究 中 的 应 用 也 越 来 越 多 。 例 如 ， 
Kasai 等 人 《〈2003) 基于 MEG 探讨 精神 分 裂 症 患 者 的 音 位 感知 问题 ， 杨 海 波 、 张 雪 健 、 周 
A AMAZE (2014) 总结 了 fNIRS 在 语音 加 工 领域 的 研究 进展 ，Beversdorf, Metzger, 
Nelson, Alonso 和 Kight (1995) 利用 SPECT 探讨 正常 人 的 单词 感知 问题 Talavage, 
oo Gonzalez-Castillo 和 Scott (2014) 总 结 了 PET 在 听觉 言语 感知 领域 的 研究 进展 。 如 能 将 这 些 
O 技术 广泛 运用 ， 必 将 深化 人 们 对 精神 分 裂 症 患者 语音 加 工 奥秘 的 理解 。 
第 二 ， 不 同 语言 的 语音 系统 存在 差异 ， 在 音 段 和 超 音 段 各 层次 、 方面 都 有 所 反映 ,而 具 
不 同 母 语 背 景 的 听 音 者 在 感知 中 对 相关 声学 信息 的 关注 焦点 、 加 工 策略 也 有 所 不 同 
(Strange & Shafer, 2008) ， 加 工 难 度 各 异 ， 可 见 有 必要 对 不 同 母语 背景 的 精神 障碍 患者 的 
语音 加 工 表现 进行 系统 比较 , 以 便 更 好 地 归纳 精神 障碍 患者 语音 感知 中 认 知 加 工 的 共性 与 个 
性 。 现 有 关于 精神 分 裂 症 患者 语音 感知 的 研究 选用 的 被 试 多 为 英语 母语 者 , 对 世界 上 其 他 语 
言 的 研究 较 少 , 而 每 种 语言 的 语音 系统 不 同 , 因此 有 必要 对 不 同 母 语 背 景 的 精神 分 裂 症 患 
开展 研究 ， 尤 其 应 该 加 大 对 中 国 精神 分 裂 症 患者 的 语音 研究 ， 原 因 如 下 : 首先 ， 世 界 上 有 
20% 的 精神 分 裂 症 患者 说 像 汉 语 这 样 的 声调 语言 , 但 大 部 分 对 精神 分 裂 症 患 者 言语 感知 的 研 
究 却 集中 在 说 非 声 调 语言 的 患者 (Yang et al., 2012) ， 这 种 状况 不 仅 与 声调 在 言语 感知 中 的 
重要 角色 不 符 , 而 且 也 忽视 了 基数 庞大 的 说 声调 语言 的 精神 分 裂 症 患者 。 昌 然 一 些 研 究 (如 
Tsao et al., 2013; Wang et al., 2017; Wang et al., 2018; Yang et al., 2012) 弥补 了 对 精神 分 裂 症 患 
者 声调 加 工 研究 的 空白 , 但 目前 的 研究 还 处 于 起 步 阶段 。 由 于 汉语 是 世界 上 使 用 人 数 最 多 的 
声调 语言 ， 所 以 从 中 国 精 神 分 裂 症 患 者 入 手 研究 声调 语言 意义 重大 。 其 次 , 英语 等 拼音 文字 
遵循 字音 转换 规则 ， 即 用 字母 作为 视觉 符号 来 映射 口语 的 音 位 ， 因 此 ,字母 词 主要 通过 组 合 


上 


音 位 ， 即 组 合 音 系 (assembled phonology) 读 出 ， 而 汉语 使 用 汉字 作为 基本 的 书写 单位 ， 汉 
字 的 笔画 没有 与 音 位 对 应 的 部 分 , 因此 ,只 有 通过 寻找 存储 在 认 知 系统 中 的 音 系 信息 才能 理 
解 汉 字 的 音 系 编码 ， 即 寻 址 音 系 〈addressed phonology) ， 两 种 语言 在 形 音 匹配 上 的 这 种 差 
异 可 能 会 导致 神经 机 制 不 同 (Tan, Laird, Li, & Fox, 2005) 。 同 时 ， 汉 语 有 四 个 声调 ， 同 音 
不 同 义 的 汉字 较 多 ， 对 音 和 调 都 准确 加 工 也 有 更 高 的 认 知 要 求 (Yang et al, 2015) 。 这 些 特 
点 都 与 拼音 文字 大 不 相同 , 所 以 , 中国 精神 分 裂 症 患 者 的 语言 特点 与 西方 国家 的 研究 结果 可 
能 并 非 完全 一 致 ,， 想 要 更 清楚 中 国 精 神 分 裂 症 患者 的 语言 特点 及 其 脑 机 制 , 为 中 国 患 者 的 诊 
断 和 发 现 病因 机 理 提供 有 效 帮助 ， 大 量 汉语 研究 必 不 可 少 。 最 后 ， 中 国有 其 独特 的 文化 和 风 
俗 习惯 ， 相 应 的 社会 情感 因素 如 何 与 语音 功能 相互 作用 ， 影 响 精神 障碍 病人 的 语音 表现 ， 也 
需要 更 多 的 研究 。 

第 三 ， 在 现 有 考察 精神 分 裂 症 患 者 语音 感知 的 研究 中 ， 多 数 在 安静 的 实验 室 条 件 下 进 
行 , 与 现实 生活 嗜 杂 的 生活 环境 脱节 ,因此 对 患者 在 噪声 条 件 下 的 语音 感知 需要 引起 研究 者 
注意 。 在 噪音 下 感知 语音 时 , 听 音 者 必须 从 各 种 混杂 声波 中 分 离 出 说 话 人 的 言语 信号 才能 识 
别 目标 音 ， 产生“ 鸡尾酒 会 效应 ”。 不 少 研究 发 现 ， 在 噪音 背景 下 ， 一些 特殊 人 群 的 语音 感 
知 比 正常 人 群 更 易 受 噪音 掩蔽 效应 的 影响 ， 如 老年 人 Nagaraj, 2017) ~ DWAJA GRAI 
等 ，2018; 杨 小 虎 ， 赵 勇 ,，2014) ， 那 么 精神 分 裂 症 患 者 是 否 也 有 更 多 困难 呢 ? 各 种 症状 的 
患者 受 不 同类 型 、 不 同 信 噪 比 的 噪音 影响 程度 是 否 也 不 同 呢 ? 另外 , 不 少 精神 分 裂 症 患 者 都 
存在 约 听 ， 不 少 研究 CU Tsao et al., 2013; Wang et al., 2018) 发 现 有 约 听 症状 的 精神 分 裂 症 
患者 在 语音 感知 上 的 表现 比 无 幻 听 症 状 的 患者 更 差 , 但 是 约 听 作为 一 种 内 部 噪音 对 患者 的 语 
音 感知 影响 的 机 制 和 原因 还 没有 得 到 深究 , 因此 对 这 些 问题 的 考察 具有 重要 的 理论 和 实践 意 
义 ， 值 得 未 来 研究 注意 。 


参考 文献 


曹 剑 芬 . (2002). 汉语 声调 与 语调 的 关系 . AAAG), 195-202. 

华 维 芬 . (1993). 英语 超 音 段 音 位 浅 析 . IWANA), 44-48. 

RA, Bai, EER, SKE, TAE, 刘畅 . (2018). 语音 型 噪音 对 二 语 者 汉语 元 音声 调 感 
RAR. OL SAE, 16(1), 22-30. 

杨 海 波 ， 张 雪 健 AMS, 刘 颖 ， 白 学 军 . (2014). 语音 加 工 的 功能 性 近 红 外 脑 成 像 研 究 进展 . 
LEGIT AW, 12(4), 566-571. 

杨 小 虎 ， 赵 勇 . (2014). RE ART SA RS, OFERE, 22(6), 934-942. 

Atkinson, R. J., Michie, P. T., & Schall, U. (2012). Duration mismatch negativity and P3a in 
first-episode psychosis and individuals at ultra-high risk of psychosis. Biological Psychiatry, 
71(2), 98-104. 

Bellani, M., Perlini, C., & Brambilla, P. (2009). Language disturbances in schizophrenia. 
Epidemiology and Psychiatric Sciences, 18(4), 314-317. 

Beversdorf, D., Metzger, S., Nelson, D., Alonso, R., & Kight, J. (1995). Single-word auditory 
stimulation and regional cerebral blood flow as studied by SPECT. Psychiatry Research: 
Neuroimaging, 61(3), 181-189. 

Carrion, R. E., Cornblatt, B. A., McLaughlin, D., Chang, J., Auther, A. M., Olsen, R. H., & Javitt, 
D. C. (2015). Contributions of early cortical processing and reading ability to functional status 


in individuals at clinical high risk for psychosis. Schizophrenia Research, 164(1-3), 1-7. 

Chan, C. C., Wong, R., Wang, K., & Lee, T. M. (2008). Emotion recognition in Chinese people 
with schizophrenia. Psychiatry Research, 157(1), 67—76. 

Chhabra, S., Badcock, J. C., Maybery, M. T., & Leung, D. (2012). Voice identity discrimination in 


schizophrenia. Neuropsychologia, 50(12), 2730-2735. 

Cienfuegos, A., March, L., Shelley, A. M., & Javitt, D. C. (1999). Impaired categorical perception 
of synthetic speech sounds in schizophrenia. Biological Psychiatry, 45(1), 82-88. 

Clark, J., & Yallop, C. (1990). An introduction to phonetics and phonology. Oxford, England: 
Blackwell. 

Covington, M. A., He, C., Brown, C., Naçi, L., McClain, J. T., Fjordbak, B. S., ... Brown, J. (2005). 
Schizophrenia and the structure of language: the linguist's view. Schizophrenia Research, 77(1), 
85-98. 

Davalos, D. B., Kisley, M. A., & Ross, R. G. (2003). Effects of interval duration on temporal 
processing in schizophrenia. Brain and Cognition, 52(3), 295-301. 

Davalos, D. B., Rojas, D. C., & Tregellas, J. R. (2011). Temporal processing in schizophrenia: 
effects of task-difficulty on behavioral discrimination and neuronal responses. Schizophrenia 
Research, 127(1-3), 123—130. 

Dondé, C., Luck, D., Grot, S., Leitman, D. I., Brunelin, J., & Haesebaert, F. (2017). 
Tone-matching ability in patients with schizophrenia: A systematic review and meta-analysis. 
Schizophrenia Research, 181, 94—99. 

Edwards, J., Jackson, H. J., & Pattison, P. E. (2002). Emotion recognition via facial expression and 
affective prosody in schizophrenia: a methodological review. Clinical Psychology Review, 22(6), 
789-832. 

Erwin, R. J., Mawhinney-Hee, M., Gur, R. C., & Gur, R. E. (1991). Midlatency auditory evoked 
responses in schizophrenia. Biological Psychiatry, 30(5), 430—442. 

Ford, M. C., Alexandrova, O., Cossell, L., Stange-Marten, A., Sinclair, J., Kopp-Scheinpflug, C., ... 
Grothe, B. (2015). Tuning of Ranvier node and internode properties in myelinated axons to 
adjust action potential timing. Nature Communications, 6, 8073. 

Gudlowski, Y., Özgürdal, S., Witthaus, H., Gallinat, J., Hauser, M., Winter, C., ... Juckel, G. 
(2009). Serotonergic dysfunction in the prodromal, first-episode and chronic course of 
schizophrenia as assessed by the loudness dependence of auditory evoked activity. 
Schizophrenia Research, 109(1-3), 141—147. 

Hoekert, M., Kahn, R. S., Pijnenborg, M., & Aleman, A. (2007). Impaired recognition and 
expression of emotional prosody in schizophrenia: review and meta-analysis. Schizophrenia 
Research, 96(1—3), 135-145. 

Hugdahl, K., Løberg, E. M., Falkenberg, L. E., Johnsen, E., Kompus, K., Kroken, R. A., ... 
Özgören, M. (2012). Auditory verbal hallucinations in schizophrenia as aberrant lateralized 
speech perception: evidence from dichotic listening. Schizophrenia Research, 140(1-3), 59—64. 

Javitt, D. C. (2000). Intracortical mechanisms of mismatch negativity dysfunction in 
schizophrenia. Audiology and Neurotology, 5(3—4), 207-215. 

Javitt, D. C., Spencer, K. M., Thaker, G. K., Winterer, G., & Hajós, M. (2008). Neurophysiological 
biomarkers for drug development in schizophrenia. Nature Reviews Drug Discovery, 7(1), 
68-83. 

Kantrowitz, J. T., Leitman, D. I., Lehrfeld, J. M., Laukka, P., Juslin, P. N., Butler, P. D., ... Javitt, D. 
C. (2013). Reduction in tonal discriminations predicts receptive emotion processing deficits in 
schizophrenia and schizoaffective disorder. Schizophrenia Bulletin, 39(1), 86—93. 

Kasai, K., Nakagome, K., Itoh, K., Koshida, I., Hata, A., Iwanami, A., ... Kato, N. (2002). 
Impaired cortical network for preattentive detection of change in speech sounds in 


schizophrenia: a high-resolution event-related potential study. American Journal of Psychiatry, 
159(4), 546-553. 

Kasai, K., Yamada, H., Kamio, S., Nakagome, K., Iwanami, A., Fukuda, M., ... Kato, N. (2003). 
Neuromagnetic correlates of impaired automatic categorical perception of speech sounds in 
schizophrenia. Schizophrenia Research, 59(2—3), 159-172. 

Kubicki, M., McCarley, R., Westin, C. F., Park, H. J., Maier, S., Kikinis, R., ... Shenton, M. E. 
(2007). A review of diffusion tensor imaging studies in schizophrenia. Journal of Psychiatric 
Research, 41(1—2), 15-30. 

Kugler, B. T., & Caudrey, D. J. (1983). Phoneme discrimination in schizophrenia. British Journal 
of Psychiatry, 142(1), 53-59. 

Ladefoged, P., & Johnson, K. (2011). A course in phonetics. Boston, MA: Wadsworth. 

Leitman, D. I., Hoptman, M. J., Foxe, J. J., Saccente, E., Wylie, G. R., Nierenberg, J., ... Javitt, D. 
C. (2007). The neural substrates of impaired prosodic detection in schizophrenia and its 
sensorial antecedents. American Journal of Psychiatry, 164(3), 474-482. 

Leitman, D. I., Laukka, P., Juslin, P. N., Saccente, E., Butler, P., & Javitt, D. C. (2008). Getting the 
cue: sensory contributions to auditory emotion recognition impairments in schizophrenia. 
Schizophrenia Bulletin, 36(3), 545-556. 

Liu, S., & Samuel, A. G. (2004). Perception of Mandarin lexical tones when FO information is 
neutralized. Language and Speech, 47(2), 109-138. 

Long, P., Wan, G., Roberts, M. T., & Corfas, G. (2018). Myelin development, plasticity, and 
pathology in the auditory system. Developmental Neurobiology, 78(2), 80—92. 

Matsumoto, K., Samson, G. T., O'daly, O. D., Tracy, D. K., Patel, A. D., & Shergill, S. S. (2006). 
Prosodic discrimination in patients with schizophrenia. The British Journal of Psychiatry, 
189(2), 180-181. 

Mitchell, R. L., Elliott, R., Barry, M., Cruttenden, A., & Woodruff, P. W. (2004). Neural response 
to emotional prosody in schizophrenia and in bipolar affective disorder. The British Journal of 
Psychiatry, 184(3), 223-230. 

Nagaraj, N. K. (2017). Working memory and speech comprehension in older adults with hearing 
impairment. Journal of Speech, Language, and Hearing Research, 60(10), 2949-2964. 

Owen, M. J., Sawa, A., & Mortensen, P. B. (2016). Schizophrenia. The Lancet, 388(10039), 
86-97. 

Park, Y. M., Lee, S. H., Kim, S., & Bae, S. M. (2010). The loudness dependence of the auditory 
evoked potential (LDAEP) in schizophrenia, bipolar disorder, major depressive disorder, 
anxiety disorder, and healthy controls. Progress in Neuro-Psychopharmacology and Biological 
Psychiatry, 34(2), 313-316. 

Pinheiro, A. P., Rezaii, N., Rauber, A., Liu, T., Nestor, P. G., McCarley, R. W., ... Niznikiewicz, M. 
A. (2014). Abnormalities in the processing of emotional prosody from single words in 
schizophrenia. Schizophrenia Research, 152(1), 235-241. 

Price, C. J. (2000). The anatomy of language: Contributions from functional 
neuroimaging. Journal of Anatomy, 197(3), 335-359. 

Revheim, N., Corcoran, C. M., Dias, E., Hellmann, E., Martinez, A., Butler, P. D., ... Javitt, D. C. 
(2014). Reading deficits in schizophrenia and individuals at high clinical risk: relationship to 
sensory function, course of illness, and psychosocial outcome. American Journal of Psychiatry, 
171(9), 949-959. 


Salisbury, D. F., Kuroki, N., Kasai, K., Shenton, M. E., & McCarley, R. W. (2007). Progressive 
and interrelated functional and structural evidence of post-onset brain reduction in 
schizophrenia. Archives of General Psychiatry, 64(5), 521-529. 

Shelley, A. M., Ward, P. B., Catts, S. V., Michie, P. T., Andrews, S., & McConaghy, N. (1991). 
Mismatch negativity: an index of a preattentive processing deficit in schizophrenia. Biological 
Psychiatry, 30(10), 1059-1062. 

Shin, K. S., Kim, J. S., Kang, D. H., Koh, Y., Choi, J. S., O'Donnell, B. F., ... Kwon, J. S. (2009). 
Pre-attentive auditory processing in ultra-high-risk for schizophrenia with 
magnetoencephalography. Biological Psychiatry, 65(12), 1071-1078. 

Strange, W., & Shafer, V. L. (2008). Speech perception in second language learners: The 
re-education of selective perception. In J. G. H. Edwards & M. L. Zampini (Vol. Eds.). Studies 
in bilingualism: Vol. 36. Phonology and second language acquisition (pp. 153-191). 
Amsterdam: John Benjamins. 

Sweet, R. A., Bergen, S. E., Sun, Z., Marcsisin, M. J., Sampson, A. R., & Lewis, D. A. (2007). 
Anatomical evidence of impaired feedforward auditory processing in schizophrenia. Biological 
Psychiatry, 61(7), 854-864. 

Talavage, T. M., Gonzalez-Castillo, J., & Scott, S. K. (2014). Auditory neuroimaging with fMRI 
and PET. Hearing Research, 307, 4-15. 

Tan, L. H., Laird, A. R., Li, K., & Fox, P. T. (2005). Neuroanatomical correlates of phonological 
processing of Chinese characters and alphabetic words: A meta-analysis. Human Brain 
Mapping, 25(1), 83-91. 

Teichert, T. (2017). Loudness-and time-dependence of auditory evoked potentials is blunted by the 
NMDA channel blocker MK-801. Psychiatry Research, 256, 202-206. 

Thoenes, S., & Oberfeld, D. (2017). Meta-analysis of time perception and temporal processing in 
schizophrenia: Differential effects on precision and accuracy. Clinical Psychology Review, 54, 
44-64. 

Todd, J., Michie, P. T., Schall, U., Karayanidis, F., Yabe, H., & Näätänen, R. (2008). Deviant 
matters: duration, frequency, and intensity deviants reveal different patterns of mismatch 
negativity reduction in early and late schizophrenia. Biological Psychiatry, 63(1), 58—64. 

Tsao, F. M., Chiang, S. K., & Liu, H. M. (2013). Lexical tone and consonant perception in 
subtypes of schizophrenia. Journal of the Acoustical Society of America, 134(5), 4235. 

van Os, J., Kenis, G., & Rutten, B. P. (2010). The environment and schizophrenia. Nature, 
468(7321), 203. 

Wang, J., Liu, Q., Wydell, T. N., Liao, J., Wang, F., Quan, W., ... Dong, W. (2017). 
Electrophysiological basis of reading related phonological impairment in Chinese speakers with 
schizophrenia: An ERP study. Psychiatry Research: Neuroimaging, 261, 65-71. 

Wang, J., Wydell, T. N., Zhang, L., Quan, W., Tian, J., Liu, J., & Dong, W. (2018). The underlying 
mechanism of deficits of speech comprehension and hallucinations in Chinese patients with 
schizophrenia. Journal of Psychiatric Research, 97, 16-21. 

Webster, D.B., Popper, A.N., & Fay, R.R. (Eds). (1992). The mammalian auditory pathway: 
Neuroanatomy. New York: Springer-Verlag. 

Whitford, V., O'Driscoll, G. A., & Titone, D. (2018). Reading deficits in schizophrenia and their 
relationship to developmental dyslexia: A review. Schizophrenia Research, 193, \\—22. 

Wylie, K. P., & Tregellas, J. R. (2010). The role of the insula in schizophrenia. Schizophrenia 


Research, 723(2-3), 93-104. 

Yang, L., Chen, S., Chen, C. M., Khan, F., Forchelli, G., & Javitt, D. C. (2012). Schizophrenia, 
culture and neuropsychology: sensory deficits, language impairments and social functioning in 
Chinese-speaking schizophrenia patients. Psychological Medicine, 42(7), 1485-1494. 

Yang, X., Wang, Y., Xu, L., Zhang, H., Xu, C., & Liu, C. (2015). Aging effect on Mandarin 
Chinese vowel and tone identification. The Journal of the Acoustical Society of America, 138(4), 
EL411-EL416. 


Speech Perception in Schizophrenia 


CAO Yi'; YANG Xiaohu!? 

(' Speech-Language-Hearing Center, School of Foreign Languages, Shanghai Jiao Tong University, Shanghai 200240, China) 
Ê Institute of Social Cognitive and Behavioral Sciences, Shanghai Jiao Tong University, Shanghai 200240, China) 
Abstract: Schizophrenia is a common psychiatric disorder characterized by a series of symptoms. 
Language impairment is one of the core features of cognitive impairment in schizophrenia. This 
article presents a critical review of behavioral and neurological studies on speech perception at 
the segmental and suprasegmental levels in individuals with schizophrenia. It is pointed out that 
special attention should be given to the exploration of speech perception in patients with 

schizophrenia speaking Mandarin Chinese. 


Key words: schizophrenia; speech perception; neuroscience 


